草庐IT

c++ - std::string 和 UTF-8 编码的 unicode

全部标签

ruby - 从 Ruby 中的字符串中删除非 UTF 字符?

如何从ruby​​字符串中删除非UTF8字符?我有一个字符串,其中包含例如“xC2”。我想从字符串中删除该字符,使其成为有效的UTF8。这个:text.gsub!(/\xC2/,'')返回错误:incompatibleencodingregexpmatch(ASCII-8BITregexpwithUTF-8string)我也在查看text.unpack('U*')和string.pack,但没有得到任何结果。 最佳答案 您可以为此使用编码。text.encode('UTF-8',:invalid=>:replace,:undef=>

ruby - Ruby 支持 unicode 吗?它是如何工作的?

我刚刚开始学习Ruby(最终转向RoR),但我刚刚被告知Ruby不支持unicode。是真的吗?Ruby程序员如何着手支持unicode? 最佳答案 您听到的内容已经过时并且(仅部分)适用于Ruby1.8或更早版本。最新的Ruby稳定版(1.9),支持不少于95种不同的字符编码(刚才在我的系统上统计)。这包括几乎所有已知的Unicode转换格式,包括UTF-8。Ruby的先前稳定版本(1.8)对UTF-8具有部分支持。如果您使用Rails,它会为您处理默认的UTF-8编码。如果您只需要了解UTF-8编码,那么Rails将无论您运行的

ruby - 我怎样才能避免在 Ruby 1.9 中的每个 UTF-8 文件的顶部放置神奇的编码注释?

我有一个Rails项目,里面有很多西里尔字符串。它在Ruby1.8上运行良好,但Ruby1.9假定源文件是US-ASCII编码的,除非您在源文件顶部提供#encoding:utf-8注释。此时文件不被视为US-ASCII。是否有更简单的方法告诉Ruby“此应用程序是UTF8编码的。请将所有和任何包含的源文件视为UTF8,除非另有声明”?更新:我写了“Howtoinserttheencoding:UTF-8directiveautomaticallyinRuby1.9files”,它会在需要时自动附加编码指令。 最佳答案 我觉得你可以

ruby `encode' : "\xC3"从 ASCII-8BIT 到 UTF-8 (Encoding::UndefinedConversionError)

tvdb中的汉尼拔剧集里有奇怪的角色。例如:Œuf于是ruby吐出:./manifesto.rb:19:in`encode':"\xC3"fromASCII-8BITtoUTF-8(Encoding::UndefinedConversionError)from./manifesto.rb:19:in`to_json'from./manifesto.rb:19:in`'第19行是:puts@tree.to_json有没有办法处理这些非utf字符?我宁愿不替换它们,而是转换它们?还是无视他们?我不知道,感谢任何帮助。奇怪的是脚本通过cron运行良好。手动运行它会产生错误。

ruby - Ruby 中这些 block 编码风格的区别或值(value)是什么?

哪种风格是首选?有充分的理由来对比另一个吗?提前致谢!1)cmds.eachdo|cmd|end2)cmds.each{|cmd|}示例代码:cmds=["create","update","list","help"]#Blockstyleone#cmds.eachdo|cmd|puts"loop1,cmd:#{cmd}"end#Blockstyletwo#cmds.each{|cmd|puts"loop2,cmd:#{cmd}"} 最佳答案 rails团队和许多其他ruby​​istsprefer对单行block使用花括号,对多行

ruby - 什么都不知道....在尝试 ri String#upcase Ruby 时

我刚刚安装了RVM,并且正在阅读TheWell-GroundedRubyist一书。在第一章中,我应该尝试riString#upcase查看有关upcase方法的文档,但是我收到一条消息:NothingknownaboutString#upcase我在SO上发现一些帖子告诉我这可能是因为未安装RDoc。但是我不明白如何修复它。我正在使用MacOSX10.6和最新的RVM。我只安装了1.9.2,此外还有标准的Ruby解释器,它随Apple的开发工具包一起提供。 最佳答案 您是否生成了文档?rvm文档生成https://rvm.io/r

ruby - Ruby 是否提供了一种使用指定编码执行 File.read() 的方法?

在ruby​​1.9.x中,我们可以使用File.open('filename','r:iso-8859-1')指定编码。如果我直接将许多短文件读入字符串,我通常更喜欢使用单行File.read()。有什么方法可以直接指定编码,还是必须求助于以下方法之一?str=File.read('filename')str.force_encoding('iso-8859-1')或f=File.open('filename','r:iso-8859-1')s=''while(line=f.gets)s+=lineendf.close 最佳答案

ruby - 如何在 Ruby 中指定输出文件编码?

使用File#open时如何设置文件的编码? 最佳答案 这是一个以UTF-16LE编码输出文件的示例:open("data.txt","w:UTF-16LE")Ruby会查看您正在编写的字符串的编码,并根据需要进行转码。这里有很详细的blogpost用优秀示例描述机制(请参阅名为“默认外部和内部编码”的部分)。 关于ruby-如何在Ruby中指定输出文件编码?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.

ruby - 编码::UndefinedConversionError

每次尝试将哈希值转换为JSON字符串时,我都会收到Encoding::UndefinedConversionError-"\xC2"fromASCII-8BITtoUTF-8错误。我试过[.encode|.force_encoding](["UTF-8"|"ASCII-8BIT"]),将.encode与.force_encoding链接起来,向后,切换参数但没有似乎有效,所以我发现了这样的错误:beginmenu.to_jsonrescueEncoding::UndefinedConversionErrorputs$!.error_char.dumpp$!.error_char.enc

ruby-on-rails - rails4 未知编码名称 - CP720

当我想运行任何gem命令时出现此错误,例如geminstallrubygems-update错误whileexecutinggem...(ArgumentError)unknownencodingname-CP720所以当我仔细查看时,我发现有人建议使用此命令将编码更改为1252C:\DevKit>chcp1252c:\DevKit>rubydk.rbinit但是在我使用它之后我仍然得到同样的错误,所以我该如何解决这个问题?????注意:我使用的是windows7 最佳答案 这个命令为我修复了它(没有第二个命令);chcp1252这